怎样提高网站的整体收录量
发布时间:2014-02-12 浏览:280打印字号:大中小
1、提高搜索引擎抓取量
要提高搜索引擎抓取量我们要处理的有两个方面:
A、让搜索引擎来的更勤停得更久,也就是加大爬虫总的停留时间。来得更勤,我们要做的就是大量的内容更新和强大的外链系统,停得更久就需要有更多的页面加上更多层次的内部链接结构。网站权重越高蜘蛛肯定会来的更勤快,例如我的细嗅蔷薇博客,写的文章基本上都是秒收的,就是因为博客权重较高的原因,权重来自于长期的原创高质量内容和外部链接权重导入,谈到外部链接,数量和质量都很重要,我们要做的就是在保证质量的基础上提高量,这样才会吸引更多的蜘蛛来爬我们的网站。
B、尽量的减少爬虫在单个页面的停留时间,这是我们都在谈但是却没有真正在意去做的事情。这里也分为两个方面:一个是网站的空间或者服务器,尽可能在自己条件允许的情况下买好一点的,让蜘蛛抓取速度更快,二是缩减页面的冗余代码,尽可能做到代码的精简合理,不要出现标签使用错误,因为有时候一个小小的
标签没闭合都可能让蜘蛛进入死循环,另外要缩小单个页面的信息量,蜘蛛的确很厉害,一般网站单个页面的信息量绝对不在话下,但是越大的信息页面,抓取花费的时间肯定越多,如果页面信息的确有很多,可以适当分页,既可以增加页面收录也可以为网站带来更多的PV。
2、提高页面质量
对于提高页面质量,国平的理解还是非常正确的,这里我昨天在chinaz看到一篇关于网页质量的文章,据说是百度工程师写的,里面讲到一个页面的检索价值大概有四个方面:A、感兴趣的受众群大小;B、该页面的稀缺程度(可替代性);C、该页面的质量高低;D、该页面的时效性特征强弱。
所以我们在借用国平理论的同时也参考一下这四个方面,互相结合,让网站页面质量更高。
A、页面代码技术方面
这一方面在前面其实也有谈到,我们在提升的时候尽可能向符合主流搜索引擎抓取友好程序靠拢,例如搜索引擎对于DIV+CSS的网站是友好的,我们就可以对网站进行适当的调整,尽可能精简代码,避免出现错误。对于搜索引擎的一些代码规则合理运用,例如nofollow就是一个很典型的例子,合理运用会帮我们更好的做好内部权重分配。
B、内容的质量
内容的质量来源于页面内容主体的受欢迎程度,原创程度,相关程度,时效新闻热点程度等,受欢迎的页面必然会是一个高质量的页面,原创度高,其可替代性就低了,在网络上能找到的也就更加新,更加具备价值,时效性高的网站会给用户新闻的享受,会更受搜索引擎关注。